时政
财经
科技
虚拟货币
其他
登录
#AI 智能体
关注
meng shao
1小时前
[Anthropic 工程博客解读] 高级工具使用功能:工具搜索工具、程序化工具调用和工具使用示例三项技术结合,显著降低 Token 消耗,工具选择更明确,复杂调用更准确。 Anthropic 最近在 Claude 开发者平台上推出了高级工具使用 (advanced tool use) 功能,让 AI 智能体能够高效处理数百甚至数千个工具,而不会被上下文窗口的限制所束缚。想象一下,一个智能体需要同时操作 IDE、Git、Slack、GitHub、Jira 或数据库等系统——传统方式下,工具定义会占用海量 Token,导致上下文膨胀、工具选择错误或调用延迟。这些新功能通过动态加载、代码编排和示例指导,显著提升了智能体的实用性和可扩展性。 核心挑战与应对策略 构建可靠的工具使用系统面临三大痛点: 一是 Token 消耗过高——例如,从多个服务(如 GitHub 和 Slack)拉取工具定义,可能瞬间吃掉 50,000+ Token 二是工具选择不准——类似名称的工具(如 notification-send-user 和 notification-send-channel)容易混淆 三是调用模式模糊——JSON 模式虽规范参数,但无法直观展示复杂格式,如日期或嵌套对象。 Anthropic 的策略是“延迟与智能”:不一次性加载所有工具,而是按需发现和调用;用代码代替自然语言来协调多步操作,减少推理轮次;并通过示例澄清用法。这些方法本质上将工具使用从静态描述转向动态执行,帮助智能体在资源有限的环境中实现复杂工作流。 三大关键技术 1. 工具搜索工具(Tool Search Tool) 这是一个“元工具”,允许智能体在运行时搜索并加载相关工具,而非预加载全部定义。工具标记 defer_loading: true 后,只有搜索工具和少数核心工具进入初始上下文。智能体可通过名称或描述动态拉取,例如查询 GitHub 任务时,只加载 github.createPullRequest。 优势:Token 节省高达 85%(从 77K 降至 8.7K),准确率提升显著(如 Claude Opus 4 从 49% 升至 74%)。实现简单:在工具数组中添加搜索配置,即可支持 MCP 的批量延迟加载。这让智能体像“智能索引”一样,高效导航庞大工具库。 2. 程序化工具调用(Programmatic Tool Calling) 智能体不再逐一用自然语言调用工具,而是生成 Python 代码在沙箱环境中执行多工具协调。工具需标记 allowed_callers: ["code_execution_20250825"],Claude 则输出包含循环、条件和并行执行(如 asyncio.gather)的代码片段。 示例:检查预算超支时,代码可并行获取团队成员、预算和支出数据,只将最终结果(如超支列表)返回给智能体,避免中间数据污染上下文。 优势:Token 减少 37%(从 43,588 降至 27,297),延迟降低(无需多轮推理),准确率在知识检索任务中从 25.6% 升至 28.5%。这特别适合处理大表格或 API 链路,如 Claude for Excel 中的批量数据分析。 3. 工具使用示例(Tool Use Examples) 补充 JSON 模式,提供输入示例来演示实际调用模式。例如,在 create_ticket 工具中,列出日期格式(YYYY-MM-DD)、嵌套对象(如 reporter)和可选参数(紧急升级)。每个工具可附 2-3 个变体示例。 优势:复杂参数准确率从 72% 跃升至 90%,尤其在 ID 格式或参数关联上。这像给智能体一份“用户手册”,让它快速掌握隐含规则。 实验结果与展望 内部基准测试显示,这些功能在 MCP 和 GIA 基准上均有提升:上下文保留率达 85%,整体准确率平均提高 10-20%。例如,在处理大型工具集时,Claude Opus 4.5 的性能从 79.5% 升至 88.1%。实际应用中,它已助力智能体无缝集成 Excel 或 Jira 等场景。
#Anthropic
#Claude
#高级工具使用
#Token 消耗降低
#AI 智能体
分享
评论 0
0
宝玉
1个月前
OpenAI DevDay: 超越提示词的艺术:AI 编程的未来是“上下文工程” 从自动补全到自主智能体,我们如何教会 AI 真正理解代码 我们正处在一个非凡的技术变革奇点。软件开发的演进史,从穿孔卡片的笨拙到集成开发环境(IDE)的精妙,每一步都耗费了数十年光阴。然而,当我们踏入人工智能的时代,这场变革的节奏被极限压缩,数十年的进程仿佛在短短数年内上演完毕。我们与机器协作构建软件的方式,正在经历一场从根本上的、不可逆转的范式转移。 这一切的核心,不再仅仅是创造更强大的模型,更在于我们如何与它们沟通。这篇文章将深入探讨这场变革的核心驱动力,揭示为何从简单的“提示词工程” (Prompt Engineering) 迈向更深邃的“上下文工程” (Context Engineering),是释放 AI 智能体 (AI Agent) 真正潜能的关键所在。这不仅是技术的演进,更是一场关乎人类开发者如何重新定义自身价值的认知革命。 当自动补全抵达极限:从“下一个词”的预测到“下一步”的行动 一切的起点,源于那个让无数开发者惊叹的时刻——代码自动补全。以 GitHub Copilot 为代表的工具,首次向世界展示了大语言模型 (LLM) 在代码生成领域的惊人潜力。它们仿佛一位无声的伙伴,总能预测出你将要输入的下一个词、下一行代码。这种体验极大地提升了编码的流畅度,将开发者从大量重复的模板化工作中解放出来。 然而,这种基于“预测”的模式很快就触及其固有的天花板。当任务的复杂度超越了单一文件,需要进行跨目录的修改、理解项目整体架构时,单纯的自动补全便显得力不从心。它的本质,仍是一种基于局部信息的高度优化的序列预测,而非对整个工程的深度理解。开发者需要的,不再是一个仅仅能补全代码的助手,而是一个能够理解复杂指令、自主规划并执行多步任务的“行动者”。这便是 AI 智能体诞生的必然。 智能体的崛起:“上下文”才是真正的护城河 AI 智能体的出现,标志着我们与 AI 协作的模式,从被动的“请求-响应”转变为主动的“指令-执行”。我们可以用自然语言下达一个宏观的目标,例如“重构用户认证模块以支持新的第三方登录”,然后由智能体自主地分析、定位、修改并验证相关代码。要实现这一飞跃,关键的挑战并不在于模型本身有多“聪明”,而在于我们能否为它提供理解任务所必需的、精准而全面的“上下文”。 这正是“上下文工程”取代“提示词工程”成为核心议题的原因。提示词工程,本质上是一种与模型“猜谜”的艺术,我们试图用精巧的语言诱导模型给出期望的答案。而上下文工程,则是一种构建信息环境的科学,它更关注于为模型提供一个高质量、高信噪比的信息场。在这个信息场中,模型不再需要去“猜”,而是能够基于充分的依据去“推理”和“决策”。正如一位优秀的指挥官,其决策的质量并非取决于命令喊得多么响亮,而是源于其对战场全局信息的精准掌握。对于 AI 智能体而言,“上下文”就是它的整个战场。 “意图感知”检索框架:为 AI 智能体构建记忆宫殿 那么,一个高质量的上下文环境是如何构建的呢?其核心在于建立一个能够深刻理解开发者“意图”的检索系统。这套系统需要超越简单的文本匹配,深入代码的语义层面。我们可以将其抽象为一个双层结构的“意图感知”检索框架,它就像为智能体在大脑中构建了一座结构精巧的记忆宫殿。 这个框架的第一层基石是“字面精确性”。这依赖于像 grep 这样传统的文本搜索工具。当我们需要寻找一个特定的函数名、变量或API调用时,它是最高效、最可靠的方式。它构成了智能体记忆宫殿中那些带有明确标签、易于查找的房间,保证了对代码库事实层面的精准定位。 然而,真正让这座宫殿变得“智能”的,是其第二层核心——“语义相关性”。 这一层通过代码嵌入 (Embeddings) 技术实现。它不再逐字比对代码,而是将代码片段转化为高维度的数学向量,从而在概念层面理解其功能与意图。例如,当我们指令智能体“更新顶部导航栏”时,即使代码文件中根本没有“导航栏”这个词,语义检索也能准确地定位到名为 header.tsx 的组件。因为它理解,“顶部导航”这个意图与 header 组件在功能上是高度相关的。这赋予了智能体一种超越字面束缚的、强大的联想与推理能力。 将计算量巨大的嵌入过程在智能体执行任务前“离线”完成,更是一种巧妙的工程智慧,它确保了在关键的推理时刻,智能体能够以最低的延迟、最高效的方式获取这些深度知识。 将字面精确性与语义相关性这两层能力结合,我们便为 AI 智能体提供了一套完整的认知工具。它既能精确地找到每一个细节,又能宏观地理解各个部分之间的逻辑关联,从而在复杂的代码世界中游刃有余。 从代码的“劳作”到思想的“游戏”:人与 AI 协作的终极图景 当我们赋予 AI 智能体强大的上下文理解能力后,软件开发的本质正在悄然改变。那些曾经占据我们大量时间的繁琐工作——修复琐碎的错误、编写重复的样板代码、应对深夜的线上告警——都将逐渐被自动化。开发者的角色,将从一个代码的“书写者”,转变为一个思想的“架构师”与系统的“指挥官”。 想象这样一个未来:清晨醒来,你的 AI 编程伙伴已经修复了昨夜的线上问题,完成了你标记为“待办”的重构任务,并为你探索新功能提供了几种迥然不同的实现原型,每一种都附带着详尽的利弊分析。你的精力将从代码的“劳作” (Toil) 中彻底解放,真正聚焦于那些机器无法替代的、充满创造性的“游戏” (Play)——设计优雅的系统架构,解决前所未有的复杂难题,以及构建真正重要的、能够改变世界的产品。 这并非遥不可及的幻想,而是正在发生的现实。AI 智能体不会取代人类的思考与判断,恰恰相反,它将通过承担执行的重负,来无限延展人类思想的边界。我们与 AI 的关系,不是主仆,而是共生的思想伙伴。在这场伟大的技术浪潮中,真正的赢家,将是那些最先学会如何为他们的 AI 伙伴构建最深刻、最丰富上下文的开发者。
#OpenAI DevDay
#上下文工程
#AI 智能体
#代码自动补全
#人与AI协作
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞